查看原文
其他

混合Logit模型: 最新实践和运用进展, 最全评述混合logit模型需注意的问题!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

关于下方文字内容,作者:韦忠吉,清华大学经管学院,通信邮箱:weizhj.18@sem.tsinghua.edu.cn

作者之前的文章:1.非线性模型中乘数和边际交互效应选哪个?为什么呢?2.前沿: BVAR, 贝叶斯VAR是什么, 为什么需要, 软件怎么做, 如何解读呢?3.诺奖得主Akerlof 猛批“遗漏之罪与经济学实践”!
Hensher, D.A., Greene, W.H. The Mixed Logit model: The state of practice. Transportation 30, 133–176 (2003). https://doi.org/10.1023/A:1022558715350
The mixed logit model is considered to be the most promising state of the art discrete choice model currently available. Increasingly researchers and practitioners are estimating mixed logit models of various degrees of sophistication with mixtures of revealed preference and stated choice data. It is timely to review progress in model estimation since the learning curve is steep and the unwary are likely to fall into a chasm if not careful. These chasms are very deep indeed given the complexity of the mixed logit model. Although the theory is relatively clear, estimation and data issues are far from clear. Indeed there is a great deal of potential mis-inference consequent on trying to extract increased behavioural realism from data that are often not able to comply with the demands of mixed logit models. Possibly for the first time we now have an estimation method that requires extremely high quality data if the analyst wishes to take advantage of the extended behavioural capabilities of such models. This paper focuses on the new opportunities offered by mixed logit models and some issues to be aware of to avoid misuse of such advanced discrete choice methods by the practitioner.
混合logit模型被认为是目前可用的最具前景的离散选择模型。越来越多的研究人员和实践者正在估计不同复杂程度的混合logit模型,混合显示的偏好和声明的选择数据。回顾模型估计的进展是及时的,因为学习曲线是陡峭的,不小心的人如果不小心就很可能陷入深渊。考虑到混合logit模型的复杂性,这些缺陷确实非常深。虽然理论是相对清楚的,估计和数据问题远不清楚。事实上,试图从数据中提取越来越真实的行为,往往无法满足混合logit模型的要求,因此存在大量潜在的错误推论。如果分析者希望利用这些模型的扩展行为能力,我们现在可能第一次拥有了一种需要极高质量数据的估算方法。本文主要关注混合logit模型提供的新机会和一些需要注意的问题,以避免从业人员滥用这种先进的离散选择方法。
1.简介
我们的老朋友logit是研究离散选择问题的重要工具。从二元出发,现在已经发展出多项式数模型(multinomial logit model,MNL)和嵌套模型(nested logit,NL),后者是现在最火的广义logit模型(Koppelman和Sethi 2000等有回顾过)。理论在60年代中到70年代初就有了,应用则晚上五年。尽管更多更先进的模型,像广义极值模型(Generalised Extreme Value,GEV)的概念和解析形式在70年代初也有了,参数估计仍然是它们在实证应用中的现实障碍。到了80年代,人们主要关注MNL和NL模型的改进,以及对其行为和经验优势与局限性的更多理解(包括对数据的要求,每个选择的效用表达式中随机部分的性质等)。有许多软件包提供了相对好使的估计MNL和NL模型的工具。
随着人们日益认识到封闭形式(closed form)MNL和NL模型的行为限制,和在分析上复杂的用于估计三个变量以上的更先进模型以及选择可能性的复杂的开放形式(open-form)表示的吸引,研究者把目光聚焦于寻找数值估计的方法。这一突破和模拟方法(simulation methods,例如模拟最大似然估计)的发展是一起的,它们让开放形式,例如多项probit,混合logit更容易地被估计了。McFadden(1985)等论文建立了模拟选择可能性并估计所有参数的方法,这是通过从潜在的错误过程中提取伪随机的现实实现的。
随着现在评估方法更加易于处理并集成到流行的软件包中,在20世纪90年代中期,我们开始看到混合logit模型的应用越来越多,并且在利用可用的和新的数据集来评估此类模型方面积累了经验的知识库。然而,仔细阅读这些文献就会发现,建模者在获得一个首选模型时经历了许多潜在的(通常没有被揭示的)挑战,给他们的建议一般都是失败的。本文的重点是分享一些活跃的研究人员最近的一些估计混合logit模型的经验,这些在过去几年中已经有了足够的知识积累。
2.混合logit的直觉描述
跟任何一种离散选择的效用模型一样,我们假设样本中的个体(q=1,2,…,Q)在T种选择情境下,每种情境面临着I个选择。假设个体考虑情境t下所有选择的集合,并从中选择效用最高的那一个。在一个离散选择模型中,和一个选择i相关联的(相对)效用通过下面这个一般形式表示:
该方法最初由Geweke引入,用于从多元截断的正态分布中计算随机变量。虽然它不能提供无偏的多元截断正态变量(如Ruud最初提出并由Borsch-Supan和Hajivassiliou(1990)详细说明的那样),但它确实产生了选择概率的无偏估计。在他们的研究中,累积分布函数被假定为是多元正太的,并由协方差矩阵M确定。这个方法是快速的,并产生平稳依赖参数和M的提取和模拟概率。后一种依赖使人们能够使用传统的数值方法,如二次山丘或梯度方法来解决一阶条件,使模拟似然函数(方程(7))在q = 1,2,…的样本个体中最大化,由此得到最大模拟似然(MSL)。
经过模型估计,有很多结果需要解释。先说好,参数估计通常从随机参数或误差组件规范中获得,不应被解释为独立的参数,而必须与其他关联的参数估计联合评估。例如,旅行时间的边际效用是平均参数、旅行长度的允许值和个体间变化的随机项的函数。这个最一般的公式将在适当考虑随机参数的分布假设的情况下写出。
到目前为止,规范已经假定备选方案的属性是独立的。如果我们允许属性(即选项)相关,那么前面的随机部分将被替换为几个参数的随机部分的混合物。
由此,对混合logit模型的概述提供了一个框架,在这个框架中,我们可以研究一些具有实际意义的重要问题。我们把它们确定为七个重要的实证项目:
  1. 选择随机参数;

  1. 选择随机参数的分布;

  1. 选择分布中点的数量;

  1. 随机参数平均值附近的参数异质性;

  1. 考虑从同一个个体中获得的观测值:相关选择的情况;

  1. 考虑参数之间的关联;

  1. 支付困难的意愿。

这些关键的实证问题之间的差异将在下面的章节中解释,但在此之前,我们需要总结用于说明各种问题的数据集的细节。我们特意选择了多个数据集,因为每个数据集提供的证据比从任何一个数据集获得的见解更多。
3.用于展示上述项目的数据(部分省略)
我们将使用三个数据集来说明各种模型中的规范、估计和应用问题的范围。考虑到对混合logit模型的关注,我们简要总结了它们的信息内容,并对其他来源进行了交叉引用以获得更多细节。受篇幅限制,我们只介绍第一个数据集。
3.1 长途汽车旅行的选择实验(数据集1)
2000年有过一项关于长途公路旅行的调查,抽样调查了新西兰六个城市/区域中心(即奥克兰、汉密尔顿、北帕默斯顿、威灵顿、但尼丁)。主要的调查是以笔记本电脑为基础进行的面对面的访谈,在访谈中,每个被调查者被要求在他们的住处有一个访谈者在场的情况下完成调查。每个被访者需要考虑16种情境,做两个选择:第一个选择包括在三种标记了的SC选项和当前的RP选项中选择,第二个选择包括在三个SC选项中选择。共对汽车司机进行了274次有效访谈,产生了4,384个汽车司机案例用于模型估计。选择实验为被调查者提供了四种选择:
A.被调查者现在/一直在使用的那条路
B.假设的2车道公路
C.假设的没有中间线的四车道公路
D.一条中间有宽阔草地的假想的四车道公路
有两种选择,一种包括所有四种选择,另一种不包括当前的道路选择。除了不存在通行费的方案A外,所有方案都由六个属性描述。由于新西兰目前没有收费公路,替代方案A的通行费被设定为零。所述选择实验中的属性为:
  1. 在宽阔道路上自由流动的时间(分钟)

  1. 在宽阔道路上被其他车辆拖慢的时间(以分钟计)

  2. 在开放道路上与紧随其后的车辆在一起的总时间所占百分比(%)

  1. 道路的弯曲(有四层属性,几乎是直的,轻微的,中等的,蜿蜒的)

  1. 运营成本(美元)

  1. 通行费(美元)

这六个属性有四个层次,我们选择如下:
自由流动旅行时间:20%,10%,+10%,+20%
时间变慢:20%,10%,+10%,+20%
车辆紧跟的时间百分比:50%,25%,+25%,+50%
曲度:几乎直,轻微,中等,弯曲
运行成本:10%,5%,+5%,+10%
如果行驶时间为:小汽车的通行费($),卡车的通行费加倍:
1小时或少于0,0.5,1.5,3
1小时到2小时30分钟0,1.5,4.5,9
超过2个半小时0 2.5 7.5 15个小时
实验设计是在32种选择情况下的4型剖面。也就是说,有两个版本的16种选择。设计的选择是为了尽量减少在选择情况下的支配者的数量。在每个版本的顺序的选择情况已被随机控制为顺序效应。例如,备选方案B所建议的水平应该始终与备选方案C和D的水平不同。设计属性与选择响应和上下文数据一起为模型估计提供了信息库。图1显示了指定选择屏幕的示例。进一步的细节见Hensher和Sullivan(2003)。在这里,我们只关注个体在三种SC选项中进行选择的模型。
4.模型规范问题
4.1.随机参数选择
随机参数提供了丰富的偏好信息数组。它们通过参数的标准偏差以及通过平均参数估计和确定的分割标准(后者包括备选方案的其他属性、社会经济和背景描述符,甚至数据收集方法和工具的描述符)之间的相互作用来确定偏好的异质性程度。它们也是跨选择项和跨选择情况适应相关性的基础。
分配适当比例的时间来估计模型是重要的,在这些模型中,备选方案的许多属性被认为具有随机参数。每个属性的不同分布假设(见4.2节)的可能性也应该被研究,特别是在符号很重要的地方。结果不一定与模拟中随机抽取的次数无关(见公式(7)和第4.3节)。建立适当的随机参数集需要考虑绘制的数量(和类型)、分布假设。这些相互依赖关系可能导致评估过程很长。
多项式logit模型的估计是建立候选属性及其(确定性)函数形式的一个基本出发点,然而,它在随机参数化属性的先验选择中是有限的,除非对每个属性发生广泛的分割。
为了帮助建立候选随机参数,McFadden和Train(2000)提出的拉格朗日乘子检验为模型中接受/拒绝保留固定参数提供了一个统计依据。Brownstone(2001)对测试做了一个简明的总结。这些测试通过构建如公式(8)所示的人工变量来工作。
这里边是条件logit选择概率。然后将这些人工变量重新估计条件logit模型,如果人工变量的系数显著不同于零,则拒绝属性x上没有随机系数的原假设。对z变量的联合显著性的实际检验可以使用Wald或似然比检验统计量进行。这些拉格朗日乘数测试可以很容易地在任何估计条件logit模型的软件包中进行。布朗斯通认为,这些测试容易计算,似乎是相当强大的综合测试;但是,它们不能很好地确定在更通用的混合logit规范中应该包含哪些错误组件。另一种检验是假设所有参数都是随机的,然后检查它们的估计标准差,对个别参数使用零基t检验和概率比检验来确定额外信息的总体贡献。虽然这很吸引人,但对大量的解释变量要求很高,而且在建立一套完整的随机参数的模型时可能会有问题。
4.2.选择随机参数的分布
如果有一个单一的问题可以引起很多关注,那就是随机参数的分布假设的影响。所选择的随机参数的分层可以采取一些预定义的函数形式,最流行的是法线、三角形、均匀和对数法线。如果响应参数需要是一个特定的(非负的)符号,则通常使用对数范式。当我们有哑变量时,具有(0,1)界的均匀分布是可行的。
分布本质上是对真实行为轮廓的任意近似。我们选择特定的分布,因为我们有一种感觉,经验真理在某个领域。不幸的是,所有常见的分布都至少有一个主要的缺陷,通常是关于尾巴的符号和长度。例如,我们可以提出一种一般化的约束三角形,其中分布的分布范围允许在均值的10%范围内变化。正态分布是众所周知的。均匀、三角形和对数法线不太为人所知,并在下面加以说明。
4.2.1 正态分布
均匀分布的分布(即与均值的上下距离)和标准差的分布不同,虽然都可以使用,但在表示均匀分布时,首选使用前者。假设s是扩展(spread),使得时间参数均匀分布于(均值-s)和(均值+s)之间。参数是分布成(均值参数估计+s(2u-1)),这里边u是标准均匀分布于[0,1]之间的潜在变量。由于u是均匀分布于0和1之间的,2u-1均匀分布于-1和+1之间,乘上s使之变成+-s。标准差可以通过把扩展除以根号3得到。
4.2.2 三角分布
对于三角形分布,密度函数看起来像一个帐篷:在中心有一个峰,在中心两侧线性下降。以c为中心,以s为扩展。密度从c - s开始,线性上升到c,然后线性下降到c + s,在c - s以下和c + s以上为0,均值和模态为c。标准差是s除以根号6。因此扩展是标准差乘以根号6。在c出帐篷的高度是1/s,斜率是
4.2.3 对数正态分布
对数正态分布在下面的推理中很常用。中心极限定理解释了正态曲线的起源。如果大量的随机冲击(有些是正的,有些是负的)以加法的方式改变了特定属性x的大小,那么随着冲击数量的增加,该属性的分布将趋向于变成正态分布。但是,如果这些冲击是乘数作用的,通过随机分布的比例而不是绝对数量改变x的值,中心极限定理应用于Y = ln(x)趋向于产生一个正态分布。因此x是对数正态分布。对加法随机冲击的乘法替代产生一个正偏的、轻峰的、对数正态分布,而不是一个对称的正态分布。双参数对数正态分布的偏度和峰度只依赖于正态分布的方差,如果方差足够低,对数正态分布就近似于正态分布。对数法线的吸引力在于它们被限制在非负域内;然而,它们通常有一个很长的右尾,这是一个缺点(尤其是在计算意愿支付时)。正是这种“不合理”的价值所占比例如此之大,常常让人怀疑对数正态分布是否恰当。
在参数估计中,经验表明,进入一个属性在一个实用表达式指定使用一个随机参数对数正态分布,并预计先验产生负面的意思估计,通常会导致模型不收敛或收敛与不可接受大意味着估计。克服这个问题的技巧是在模型估计之前将属性的符号反转(即定义属性的负数,而不是对估计的参数施加符号变化)。其逻辑如下。对数法线只有在正数时才有非零密度。因此,为了确保一个属性对于所有被采样的个体都有一个负数参数,必须输入该属性的负数。负属性的正对数正态参数与属性本身的负对数正态参数相同。
4.2.4 为分布增加约束
在实践中,我们经常发现任何一种分布都有优点和缺点。弱点通常与分布在其极端处的扩展或标准偏差有关,包括对对称分布的行为上不可接受的符号变化。对数正态分布有一条长长的上尾。由于标准偏差的关系,法向、均匀和三角形可能会给某些参数带来错误的符号。一个吸引人的解决方案是使每个随机参数的散布或标准偏差成为平均值的函数。例如,根据正态分布,通常的规范是定义,这里边vi是随机变量。约束规范为:当变量z为任何正值时,其变量的标准差为1(还记得吧,vi的标准差为1)。我们通常期望z在0 - 1范围内,因为大于平均值估计的标准偏差通常会导致行为上不可接受的参数估计。
这个约束规范可以应用于任何分布。但是,对于一个mean = spread的三角形,如果z = 1,那么密度从0开始,线性地上升到均值,然后在均值的两倍再次下降到0。正如人们所预料的那样,它已经达到了顶峰。它的下界在0处,上界在合理的估计值处,并且是对称的,这样平均值很容易解释。这对于处理支付意愿的参数很有吸引力,这些参数必须是正的。同样,对于βi=β+βvi,β的符号是无约束的。vi的负的系数只是逆转了所有的标记,但并不改变解释。在这种情况下,变化的范围将被限制在区间(2β,0)。例如,这可能限制一个价格系数为负。
4.2.5 离散分布
上述连续分布集施加了一个先验限制。另一种选择是离散分布。这样的分布可以看作是随机分布的非参数估计量。使用个体间相同的离散分布相当于一个潜在的分割模型,该模型属于某个段的概率仅为常数的函数(见Louviere等人(2000)关于此类模型的讨论,第10章)。然而,允许这种概率成为单个属性的函数,就等于允许描述非参数分布的点在个体之间变化。在本文中,我们关注随机分量的连续分布。Greene和Hensher(2003)对比了潜在类模型和混合logit模型。
4.2.6 分析分布的经验比较
在大多数实证研究中,人们往往得到类似的平均数和可比的方差测量的正态分布,均匀分布和三角形。然而,对于对数正态分布,证据往往会发生很大的变化。正态分布、均匀分布或三角形分布的平均值通常位于对数正态分布的模态和平均值之间。在表1中,我们使用数据集1展示了一些关于关键行为输出的典型结果,即节省的旅行时间(VTTS)的值,注意到标准偏差用于正态分布和对数正态分布,以及均匀分布和三角形分布中的分布。VTTS是时间的边际效用与成本的比值。这里假设成本参数(边际效用)是非随机的,时间的边际效用允许随行程长度变化,并且具有随机成分。图表2中的结果是用以下公式推导出来的:
图表 2
其中tripl是以分钟为单位的行程长度,60是美元/分钟到美元/小时的换算,n是标准正态分布,u是均匀分布,t是三角形分布。每个个体的VTTS被重复(250)随机抽取, t和uc估计,并导出平均值和标准偏差(或扩散)。正态矩、三角矩和均匀矩非常相似(包括未报告的相关模型的总体拟合优度);对数正态分布明显不同于难以接受的大标准差。然而,对数正态分布保证了VTTS非负的,而其他三个(无约束分布)几乎肯定意味着一些负的VTTS,如图4所示。在本应用中,法线、三角线和均匀线的负VTTS百分比分别为19.21%、39.33%和37.92%。这些百分比是由VTTS的累积频率分布得到的。
图表 3
4.2.7 揭示经验分布,以协助寻找解析分布
 如上所述,选择具有理想行为特性的分析分布并不是一项容易的任务。实际上,真实的分布可能是双模态或多模态,结果是没有一个流行的分布是合适的。考虑到为随机参数选择合适的分析分布的不确定性,经验的观点可能是有用的。也就是说,我们能否通过参考个体层面的参数估计来告知分布的选择?这包括为每个抽样个体建立唯一的(平均)参数估计,然后绘制分布图(简单地计算一个标准差或分布不能揭示分布的形状)。
为了说明这一点,给定一个足够丰富的数据集(如数据集2),其中我们对每个抽样个体有多个观察(在陈述的选择实验中很常见),我们可能会估计使用16个选择情况的每个抽样个体的多项式logit模型。可以使用核密度(在下面和Greene 2002年定义)非参数地绘制出派生的特定参数估计值,以揭示其在抽样总体上的分布信息。检查个人特定参数的经验分布提供了关于结构和方法的线索,这种结构可能被合并回一个混合logit模型。
然而,根据经验建立真实分布是一个挑战,因为在真实数据中可能存在偏差,无论是揭示的还是陈述的选择数据。当要估计特定个体的模型时,在选择情况下属性水平的可变性变得更加关键。可变率有限的指定选择设计(特别是当可变率相对于当前选择是一个固定的范围)会在实现渐近有效的参数估计方面产生问题。在使用一些选择情况下的单个个体数据估计的模型中,发现大得不能接受的t值和错误的符号是很常见的。例如,在对16种选择情况和10个自由度估计的单个模型的数据集2中,高达80%的抽样个体有一个参数在统计上不显著(有时包括一个错误的符号)。我们怀疑这在很大程度上是在陈述的选择实验中所提供的属性水平有限的可变性的产物,在个体受访者水平的选择情境中。改进的可变性可以通过许多策略来实现,例如在大范围内增加级别的数量,以及在选择情况下对具有公共级别数(例如4个级别)的给定属性的可选属性范围进行抽样。如果可以建立商定的分割标准(如行程长度、个人收入),也可以通过汇集个人子集来适应。选择合适的策略很复杂,而且研究不足。
我们提出的方法包括估计Q + 1模型(其中Q是样本中的143个个体)。除了一个涉及整个样本的模型外,其他每个模型都是通过去除一个不同的个体来区分的。参数的数值的差异估计模型基于全部样本(143)和基于142人提供了每个模型的贡献(增量边际效用)的一个特定的个体样本均值的总体参数估计,因而是个人偏好异质性的概要文件。数据集2用来说明这个过程。
我们绘制了143个模型的参数估计矩阵,以建立每个属性的边际效用(即偏好异质性)的经验剖面。核密度估计器是一种有用的方法,因为它可以非参数地描述参数的分布,也就是说,不需要对基本的解析分布作任何假设。核密度是人们熟悉的直方图的一种修改,直方图用于图形化地描述观测样本的分布。核估计器克服了直方图的缺点,首先直方图是不连续的,而(我们的模型假设)基础分布是连续的,其次,直方图的形状关键取决于假设的宽度和箱子的位置。直觉告诉我们,使用更窄的箱子可以减轻第一个问题,但这样做的代价是,每个箱子里的观测数量下降,因此直方图所描绘的更大的图像变得越来越不稳定和不精确。核密度估计器是一个平滑的图,它显示了对于每一个选定的点,在它附近的样本的比例。(因此得名密度)近度是由一个称为核函数的权值函数定义的,它的特征是,样本观测距离所选点越远,所获得的权值就越小。
单个属性的核密度函数使用以下公式计算:
图表 4
4.3 为仿真选择点的数目
保证平稳的参数估计集合所需要的提取次数存在巨大差异。一般来说,似乎随着模型的形式在随机参数的数量和围绕均值的偏好异质性的处理,以及属性和选项之间的关联方面变得复杂,给定形式的抽取(例如Halton智能抽取)所需的次数也会增加。并没有一个标准的数,不过经验表明,最低25次智能抽取,能让有三个选择和一到两个参数(性质之间没有关联,均值附近的异质性没有分解)的选择模型产生稳定性,尽管100看起来是个不错的数字。然而,最好的测试是用一组数字来估计模型(25,50,100,1000,2000这样的抽取)。每一种模型的稳定性/精度的确定是非常重要的。只有一个随机参数的下表提供了143个个体从25到2000个经验分布的一系列运行(数据集2)。智能绘图(数据集1中的汽车司机)。结果在大约500次绘图后稳定下来,这可能是多余的,特别是考虑到只有一个维度的集成。给定在比较模型参数估计的通常尺度考虑,为随机参数,总时间的平均值对其标准差的比率,是在显示如何稳定分布的前两个时刻的关系的稳定性的信息。在这个应用程序中,整个绘图范围的比率范围非常相似,不会对分布的形状或分布的某些不可接受的变化发出警报。在推导支付意愿指标(如VTTS)的经验分布时,这一点尤为重要。
有人可能会问,为什么分析人员不简单地选择更大数量的抽取,以认识到更大的可能性,从而达到适当的稳定参数估计集?较少的绘图数量是一个相关的考虑因素,其本质上是在大量的绘图中,在估计首选模型之前,相对快速地探索替代模型规范的能力。即使使用快速的计算机,它也可能需要花费数小时的运行时间,其中包含许多随机参数、大样本大小和数千次绘图。知道参数稳定性什么时候出现问题具有极大的实用价值,使分析人员能够在一个不太可能误导推理过程的绘制域中寻找改进的模型。
Bhat(2001)和Train(1999)发现,使用100个Halton数估计参数的模拟方差低于1000个随机数。在125次霍尔顿抽取中,他们都发现模拟错误是1000次随机抽取的一半,比2000次随机抽取的小。估计过程要快得多(通常快10倍)。Hensher(2000)研究了涉及10、25、50、100、150和200次抽取的Halton序列(带有三个随机泛型参数),并在VTTS环境下与随机抽取进行了比较。在所有被研究的模型中,Hensher得出结论,少量的draw(低至25)产生的模型吻合度和平均VTTS几乎无法区分。这是复杂选择模型估计方面的一个显著发展。然而,在我们确定我们已经找到了最好的抽签策略之前,研究人员正在发现其他可能更好。例如,Sandor和Train(2002)对random、Halton、Niederreiter和正交数组抽取的研究发现,纯随机抽取的结果常常令人困惑,有时表现得比它们应该做的好得多,有时各种类型的抽取都比它们应该做的差得多。在估计的模拟方差中我们遗漏了什么?也许是由于优化算法不同的估计不同的绘图?最近Bhat对积分维数绘制类型的研究(已出版)表明,由于高维数序列的相关性,标准霍尔顿序列的均匀性在高维数中被打破。Bhat提出了一种打乱这些相关性的版本,以及一种计算方差估计的随机版本。这些最近研究的例子证明了对模拟绘图进行持续调查的必要性,特别是当强加分布的属性数量增加时。
4.4 一个随机参数在均值附近的偏好异质性
在随机参数的平均估计和协变量之间引入交互作用等价于揭示在平均参数估计周围存在或不存在偏好异质性。这与与随机参数相关的参数估计的标准差不同。如果交互作用在统计上不显著,那么我们可以得出结论,在观察到的协变量的基础上,平均值周围没有偏好异质性。这并不意味着在平均值周围没有偏好异质性,只是我们没有揭示它的存在。这就意味着分析人员完全依赖于参数估计的平均值和标准差,后者代表所有来源的偏好异质性。
为了说明平均值周围的偏好异质性的作用,我们将表2中的结果与平均值周围的异质性进行对比,其中异质性是由旅行长度定义的。统计上显著的交互协变量的存在减少了旅行时间平均估计的非交互成分的作用。当与当前应用中的均值估计相结合时,它产生了总体均值和标准差的参数估计之间的相关性,当平均值周围的异质性用行程长度表示时,标准差的参数估计略高。给定每个抽样个体的行程长度,异质性为3.55,非异质性为3.19。对这种相关性的兴趣归因于减少标准偏差或参数估计的散布的愿望,以便在整个分布上建立合理的估计(对于无约束的分布,这并不总是可能的)。我们在这里发现,偏好异质性的来源通过平均数的分解在某种程度上得到了表示,但大部分仍在随机成分之内。这突显出越来越需要重点研究的变化随机组件(Louviere et al . 2002年)和一个认识到潜在的可变性来源与许多来源(如研究设计)通常不被选择的属性和特点的受访者。
4.5 考虑同一个人的观察结果:相关的选择情况
在陈述的选择实验中,来自同一个人的观察是混合logit估计的常见数据来源。在某种程度上,这种联系是由于认识到SC数据通常比显示偏好(RP)数据丰富得多,因此SC数据为增强混合logit模型的行为能力提供了真正的机会。
对于每个抽样个体而言,在陈述的选择反应上存在多个观察,这意味着在观察之间存在相关反应的可能性违反了经典选择模型估计中的观察独立性假设。这种相关性可以许多来源的产品包括社会经济的共性描述符不不同选择情况对于一个给定的样本个体和提供选择的测序情况导致混合物的学习和惯性的影响,在其他可能影响选择的反应。
混合logit模型,通过IIA属性的放宽,使模型能够以这样一种方式指定,即来自给定个体的不同选择情况下的误差成分是相关的。为了激发这一点,并特别表明相关性和偏好异质性是相关的,因此这是混合对数如何处理跨选择情况的相关性的关键,想想未被观察到的效用来源以及它们可能被如何对待。考虑一个简单的随机实用模型,其中存在对所提供的可观察属性和未观察属性的异质性偏好:
其次,方程(15)显示了偏好的异质性如何在不同的选择情况下导致相关的错误。这是通过两种选择情况下价格和其他属性之间的相互作用的参数化来揭示的。这种异质性是选择情况之间的一种特殊类型的相关性,人们还没有很好地理解。为了获得选择模型参数的有效估计,应该在模型中包含异质性结构的说明。Daniels和Hensher(2000)和Bhat和Castelar(2002)指出,如果没有明确地将偏好异质性考虑在内,那么可选误差之间的相关性可能会与未观察到的偏好异质性相混淆。其中一种方法是将与每个属性(包括price)关联的参数指定为随机,这正是混合logit模型的目的。只要认识到偏好异质性必须对所有备选方案在所有选择的情况下定义一个单独的年代选择反应(即数据集1、2和4中的16)然后通过显式相关性自动适应造型偏好异质性存在在所有选择的情况下所定义的基本随机参数的协方差矩阵。这种相关性对瞬时陈述的选择来说不太可能是自回归的,因为它不是长期积累经验的产物,通常归因于状态依赖。相反,它是在一个非常短的时间内,由同一个人评估的,在选择情况之间共享的偏好异质性的认知。这里的讨论假设每个用随机参数指定的属性在给定的选择情况下(在选项内和选项之间)独立于其他指定的属性。这个在下一节中讨论的限制可以放宽并进行测试。
4.6 考虑参数之间的相关性
所有的数据集,不管每个抽样个体的选择情况的数量,都可能有未观察到的影响,这些影响与给定的选择情况下的备选方案相关。认识到这一点的一种方法是允许备选方案中常见的属性的随机参数之间的相关性。这产生了一个非对角估计的协方差矩阵,该矩阵识别可选方案内部和之间的属性之间的依赖关系(通过将每个随机参数的方差表示为一个误差成分)(取决于属性参数是否通用)。
所有随机参数均服从对数正态分布,且与这些参数相关的属性正负相反。VTTS(每人小时)分布产生了完全不同的平均值和标准差。对于整个样本,它们的范围从作为随机参数的旅行成本的平均值4.77美元到作为随机参数的旅行时间的平均值5.76美元,以及当时间和成本都是随机参数时的平均值23.40美元。由于对数正态分布有一个很长的尾巴(见下表),通常建议可以删除最后几个百分位数,以至少确保平均数能更好地代表大多数个体(认识到对数正态分布的这个不幸特征)。当我们去除最高的两个百分位数时,平均值和标准偏差发生了显著变化,特别是对于具有两个随机参数的模型(比较基于M3的6和7)。作者对大量数据集的经验表明,一种现象不是特定数据集特有的,而是普遍存在的。只有在研究了WTP输出之后,才会强调实际分布的关键影响。Armstrong等人(2001)在置信区间的背景下讨论了这个问题。
出于任何原因任意删除分布的一部分的顾虑表明受约束的分布可能更有意义。为了说明对对数正态分布施加约束的含义,我们使用数据集3估计了一系列模型。我们将标准差限定为均值的0.75、1.0、1.5和2.0。26结果总结在上表和下图中。当我们从均值的0.75移动到均值的两倍时,分布仍然有一个长尾,VTTS的平均估计值在下降(从19.09到15.08)。考虑到更严格的标准偏差应该会降低均值,这在一开始似乎有些奇怪;然而,只有当分布在分子上时,这才是正确的。此处VTTS的计算采用成本变量作为随机参数(即分母),因此计算结果与预期一致。特别值得注意的是,随机参数的平均估计值大幅增加,几乎补偿了受约束的标准差,对总体平均VTTS的影响要小得多。虽然我们有能力强加这一系列的限制,但这样做似乎没有强大的理论基础。然而,分布是分析性的概念,因此施加这种约束并不比不受约束的分布更好或更差,除非存在理论/行为上的理由。除了WTP的标志之外,我们似乎没有理论上的论据来支持一个发行版胜过另一个发行版。从业者很可能会对基于对数正态分布的长尾效应的WTP测量方法保持怀疑。另一种选择可能是更多地考虑属性的分割,以便沿着一条线(基本上是未定义分布上的点)建立一组离散的固定参数。这样做的缺点是,人们可能会选择一组阈值和分段标准,它们不能充分表示未观察到的效应的方差结构中的异质性。
为了研究约束对对数正态分布以外的分布的影响,我们估计了一个使用三角形分布的模型,对数据集3的扩展施加约束。将扩展设置为1.0可以保证一个非负号。任何其他值都将导致这两个符号。原因如下。和前面一样定义,βi+scaleβit,在这里,t是范围从-1到+1的三角形分布。如果规模等于1.0,范围是0到2β1。我们发现,价差等于1.0的平均VTTS是$7.62(范围为$4.93到$14.1)。因此,与平均值为$2.51、范围从$5,848到$3,112的无界价差相比,整个分布在正的VTTS范围内(尽管99%的值在$200到$240的范围内)。下图显示了这两个分布。在此基础上,我们得出结论,一个下界三角形分布具有吸引力,因为它消除了对数正态的长尾,同时确保了WTP的行为正确的符号。对受限分布的初步调查表明了正在进行的研究的一个主要主题。

5.结论
我们使用混合logit模型所面临的持续挑战主要来自于数据的质量。混合logit当然需要比MNL更好的数据质量,因为它提供了一个扩展的框架,在其中捕获更多的真实行为变异的选择。广义上讲,混合logit模型比大多数离散选择模型更符合现实,因为每个个体在他们的感知选择集中对每个选择都有他们自己的内部相关的系统和随机成分。随着离散选择模型在其行为假设上的限制性减少,识别与系统和随机成分的均值和方差相关的偏好异质性来源的可能性增加。最终我们想提高造型能力,提高模型的可预测性当个人面对决策环境的变化是由一组属性的选择,决策者和其他上下文效应的特点(包括数据收集任务的复杂性,尤其是表示选择实验)。解释力的来源以潜在复杂的方式存在于系统和随机组成部分中,并且可以通过代表观察到和未观察到的效果的参数的平均值和方差来捕获。混合logit模型无疑为研究这些行为现象提供了新的机会。
出于任何原因任意删除分布的一部分的顾虑表明受约束的分布可能更有意义。为了说明对对数正态分布施加约束的含义,我们使用数据集3估计了一系列模型。我们将标准差限定为均值的0.75、1.0、1.5和2.0。26结果总结在上表和下图中。当我们从均值的0.75移动到均值的两倍时,分布仍然有一个长尾,VTTS的平均估计值在下降(从19.09到15.08)。考虑到更严格的标准偏差应该会降低均值,这在一开始似乎有些奇怪;然而,只有当分布在分子上时,这才是正确的。此处VTTS的计算采用成本变量作为随机参数(即分母),因此计算结果与预期一致。特别值得注意的是,随机参数的平均估计值大幅增加,几乎补偿了受约束的标准差,对总体平均VTTS的影响要小得多。虽然我们有能力强加这一系列的限制,但这样做似乎没有强大的理论基础。然而,分布是分析性的概念,因此施加这种约束并不比不受约束的分布更好或更差,除非存在理论/行为上的理由。除了WTP的标志之外,我们似乎没有理论上的论据来支持一个发行版胜过另一个发行版。从业者很可能会对基于对数正态分布的长尾效应的WTP测量方法保持怀疑。另一种选择可能是更多地考虑属性的分割,以便沿着一条线(基本上是未定义分布上的点)建立一组离散的固定参数。这样做的缺点是,人们可能会选择一组阈值和分段标准,它们不能充分表示未观察到的效应的方差结构中的异质性。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存